微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍
微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍近日,腾讯微信 AI 团队提出了 WeDLM(WeChat Diffusion Language Model),这是首个在工业级推理引擎(vLLM)优化条件下,推理速度超越同等 AR 模型的扩散语言模型。
近日,腾讯微信 AI 团队提出了 WeDLM(WeChat Diffusion Language Model),这是首个在工业级推理引擎(vLLM)优化条件下,推理速度超越同等 AR 模型的扩散语言模型。
当科技巨头们正扎堆把 AI 塞进眼镜、手表、耳机这些贴身设备,OpenAI 的首款 AI 硬件却可能反其道而行之—— 造一支 AI 笔。据博主智慧皮卡丘从供应链渠道获知的消息,OpenAI 与前苹果首席设计官 Jony Ive 合作的硬件项目内部代号「Gumdrop」(软糖)。
今天,我看了卡兹克的《我的 2025 年度 AI 大盘点——前路已明》读罢总觉得侧重于参数罗列,内容略显单薄,缺乏实战的颗粒度,我较为认同秋芝的《年度好用 AI 大赏——小白必备》但细节描述上不够详细。
近日,美国华盛顿大学博士生邵如琳和合作团队打造出一个名为 Deep Research Tulu(DR Tulu)的深度研究小助手。使用一次 OpenAI 的 Deep Research 服务可能需要大约 1.8 美元,而 DR Tulu 使用一次的成本却不到 0.002 美元,这几乎是千倍的效率提升,这意味着未来个人或者小团队也能负担得起高质量、高可信度的 AI 研究服务。
结婚誓词是 AI 写的,劝分劝离的建议是 AI 给的,就连出轨对象也是 AI。 作者|Moonshot 编辑|靖宇 如果说这个世界上有什么事比「被分手」更惨,那大概就是「被 AI 分手」,或者说关系里
时隔七年,罗永浩重操「靠嘴吃饭」的旧业,举办了一场状况百出的年度科技春晚。 先是经典环节的直播迟到,重新定义了什么叫晚上 7 点,让我们白白看了近三十分钟广告,紧接着又是一场硬控 4 小时的「广告大会
GetSeed要做的,是帮你从记录里长出新的认知。昨天晚上看了跨年演讲的同学,可能对我做的GetSeed AI录音卡有印象。没印象也没关系,今天这篇内容,我就和你详细讲讲这款AI产品的台前幕后,包括做产品过程中,我所有的思考和遇到的问题。
在 《我招了 6 个 AI 员工一起干活》 一文中,我介绍了如何招聘 6 个 AI 员工,并让他们在同一个工作间一起干活。招聘 AI 员工,我最希望他们帮我干的就是编程相关的活。在给他们具体的任务之前,先评估一下他们的能力。
最近,APPSO 终于拿到了这台来自黄仁勋倾情推荐的个人超算,英伟达 DGX Spark;到手的第一感觉,就是「小而美」。这电脑也太小了,没有 Mac Studio 那般笨重,可能就和 Mac Mini 差不多大;然后是银色的亮和用来散热的金属丝网又让它有点不一样,是专属的硬核美感。
很多人可能不知道,我是 Trae 的老用户。